Di modul ini, kita beralih dari paradigma tradisional penghalusan berbasis bobot ke dunia dinamis Pembelajaran dalam Konteks (ICL). Kami mengeksplorasi bagaimana Model Bahasa Besar (LLM) mencapai penguasaan tugas bukan dengan mengubah arsitektur internal mereka, tetapi dengan memanfaatkan struktur prompt itu sendiri untuk menavigasi ruang laten yang kompleks.
1. Dari Menjelaskan ke Menunjukkan
Sementara instruksi memberikan arahan umum, "imitasi" melalui pasangan masukan-keluaran $(x, y)$ berfungsi sebagai panduan non-parametrik. Contoh-contoh ini berperan sebagai anchor statistik yang menyempitkan distribusi probabilitas model, mengurangi ambiguitas yang melekat pada instruksi bahasa alami yang mentah.
2. Mekanisme Perhatian
ICL bergantung pada mekanisme perhatian Transformer untuk melakukan "induksi tugas." Dengan mengidentifikasi pola teratur dalam urutan yang Anda berikan, model menemukan pemetaan fungsional tertentu dalam ruang dimensi tinggi, memungkinkannya meniru gaya dan struktur dengan presisi tinggi.
Goal: Provide a three-exemplar few-shot prompt that teaches the model a specific "Concise Executive" style, rather than just a generic professional tone.
Adjectives like "Concise" are subjective and have broad probability distributions; examples provide a concrete structural template that the attention mechanism can emulate with mathematical precision.